责编 | 兮
2021年5月11日,National Cancer Institute的Daniel R. Larson和National Institute of Arthritis and Musculoskeletal and Skin Diseases的Markus Hafner合作(共同一作为万奕含博士和Dimitrios G. Anastasakis)在Cell上发表了文章Dynamic imaging of nascent RNA reveals general principles of transcription dynamics and stochastic splice site selection,首次实现在内源基因中实时观察剪接动态性,通过动态转录组揭示转录的基本属性和剪接体工作机制。
记得在读《三体》的时候, 小说中描写的三个童话使我脑洞大开。其中之一是王国的新画师。这个读来唏嘘不已的故事告诉我们维度限制了我们的眼界。一个二维空间的生物眼中的三维世界仅仅是长短不一的线,而作为三维空间生物的我们也无法预知四维空间的层次。在从事我目前的研究的过程中,我的兴趣和动力也正来源于对于基因表达认知过程维度的拓展。
生命体的中心法则告诉我们遗传信息的传递需要通过转录、RNA修饰剪辑、翻译等过程将DNA信息解码为蛋白质从而发挥功能。基因调控领域的前辈们采用大量的生物化学和遗传学的工具帮助我们从细胞群体的角度理解转录和剪接机器的工作机制。然而,在细胞群体中衡量RNA的丰度,剪接异构体的相对比例等特征,可以看作是停留在单维度水平理解基因转录。单细胞测序则可以看作是在单细胞分辨率的维度对基因表达进行展开,但是它局限于某个特定的时间点对细胞的测量。通过实时记录单分子的新生RNA在单细胞水平的动态,使我们对于转录、剪切等过程的理解在单细胞分辨率的水平上进一步增加了时间维度,是对传统的基因表达一维空间尺度的理解进行多维展开。
如果想象我们自己是一个纳米机器人,能够进入细胞从微观的角度理解生命体的运转,那么我们所观察到的一个个生物过程的发生将会是以生物大分子以布朗运动为基础,游离、碰撞,识别,结合,在一定的概率下形成发挥功能的复合体,这些复合体又动态地变化、解离,周而复始。以转录起始为例,这个简单的生命基本过程却需要众多转录因子、中介体、DNA顺式元件、组蛋白修饰、染色质结构、RNA polII复合体等等因素,在对的时间来到对的地方。即使万事具备,RNA pol II复合体也仅有10%的概率成功启动转录。这些微观的转录过程中内在的随机属性,映射在基因表达上就会呈现出细胞与细胞间的异质性。我们的研究发现,目前为止在人源细胞中所有观测到的的转录模式均为“脉冲式转录”(Bursty transcription),即特定基因合成RNA的转录过程是由一系列不连续的“转录脉冲”(Transcriptional bursting)所组成。随着基因的不同,每一个特定基因会呈现出个性鲜明的转录脉冲特征 。我们通过脉冲大小(burst size)、脉冲频率(burst frequency)和脉冲持续时间(burst duration)来描述基因动态转录的特性。我们的研究揭示不同的基因转录的脉冲大小相对保守,而脉冲频率具有基因特异性。脉冲频率不但能够解释细胞内相关基因的RNA丰度,更与该基因的异质性有直接的联系,基因动态转录的OFF time越长,该基因的细胞间异质性越大,这也解释了生命体中非遗传信息相关的异质性的来源。揭示生物大分子机器——剪接体在细胞内源条件下如何运作一直以来,教科书中的对剪接体的传统描述是其具有高保真,确定性酶的观点。但是,越来越多的证据表明剪接体是一个高度动态化、异质性的核酶(ribozyme)。人类基因组三万个基因,平均每个基因含有7个内含子,平均首内含子长度为14kb。和RNA聚合酶不同,剪接体复合物在剪接每一个内含子的过程中需要重新组装,然后解聚。这对于一个含有300多个蛋白质、RNA组分,mega dalton的生物大分子机器来讲,如何达到在生物体内在的随机性的背景下高效、精确的运作,是一件不可思议的事情。我们观察到剪接单个内含子的动力学变化程度是出乎意料的,甚至对于从相同基因座在同一细胞中合成的pre-mRNA而言,其剪接动力学跨度可以在数分钟内或持续超过 1小时。更为重要的是,我们发现在人类转录本中,剪接体活性远高于预期。其实,这是一个一直以来令人迷惑不解的问题,在浩瀚的人类基因组信息中,有太多的RNA顺式序列具备完美的剪接受体或剪接供体的特征,剪接体是如何在纷繁复杂的序列信息中选择剪接位点的?结合基于多种全基因组整合检测,我们提出了“随机剪接位点选择 (stochastic splice site selection)”模型。首先,1)photoactivatable ribonucleoside enhanced crosslinking PAR-CLIP显示U2AF异二聚体的在内含子序列中存在普遍结合,表明整个内含子中可能存在剪接体组装;第二,脉冲追踪和长链的新生RNA测序揭示了这些未注释的内含子剪接位点的用法;第三,改进的lariat sequencing进一步鉴定了整个内含子中剪接反应的副产物,尤其对于长内含子,我们检测到大量片段化的lariats,证实广泛存在的剪接活性。非常重要的是,我们通过内源性人类基因内含子中的内源的双色标记方案实现了剪接活性的直接可视化,这也是首次实现在内源基因中实时观察剪接动态性。我们发现对于同一个细胞,同一个基因, 同一个内含子,在不同的时间点所作出的剪接位点选择是不同的,即体现了生物大分子机器——剪接体的动态过程具有随机性——这一生命过程的基本内在特征。随机性剪接位点选择是对传统的高确定性剪接位点选择模型的挑战,她在一个大的框架下涵盖了选择性剪接、cryptic splicing等多种剪接模式,是对剪接体工作机制的新思考。正如开篇所说,维度的拓展带领我们来到了一个全新的认知高度。在完成这个课题的过程中,我像一个孩子一样,带着好奇的眼睛重新探索多维空间中基因表达的动态,生物机器运转的过程。这是一个充满挑战又收获多多的过程。动态转录组是一个新生的领域,我希望能从baby step开始,带着单细胞、空间和时间的维度,探索生物大分子的动态性同生命过程以及疾病发生的联系。https://doi.org/10.1016/j.cell.2021.04.012【原创文章】BioArt原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为BioArt所拥有。BioArt保留所有法定权利,违者必究。